AI资讯新闻榜单内容搜索- LLM

Karpathy知识库「LLM Wiki」火爆了，全网围观讨论

Karpathy 表示，大多数人使用 LLM 处理文档的方式，基本都类似于 RAG：你上传一组文件，模型在查询时检索相关片段，然后生成答案。这种方式是有效的，但问题在于每一次提问，模型都在从零重新发现知识。没有积累。

来自主题: AI资讯

8740 点击 2026-04-06 08:51

这个「反人类」AI插件，专门让你体验DeepSeek宕机的感觉｜附安装地址

官方宣传语：你是否隐隐担忧，自己或身边的人正在：参与一场席卷所有人的技能大退化？遭受 LLM 诱发的？一个名为 Sam Lavigne 的大学教授，最近发布并开源了一款名为「Slow LLM」的 AI 工具。

来自主题: AI资讯

8282 点击 2026-03-30 23:55

扩散语言模型总是均匀发力，华为诺亚教它「抓重点」

这两年，扩散语言模型（Diffusion LLM）一直是个很有讨论度的方向。

来自主题: AI技术研报

6728 点击 2026-03-23 09:51

比现有框架快22倍，浙大开源EasySteer：高性能LLM Steering统一框架

在此背景下，浙江大学研究团队提出了 EasySteer——一个基于 vLLM 构建的高性能、可扩展 LLM Steering 统一框架。该框架通过与 vLLM 推理引擎的深度集成，相比现有 Steering 框架实现了 10.8-22.3 倍的推理加速，同时提供更细粒度的干预控制，并为八大应用场景提供了预计算 Steering 向量与完整复现示例，方便研究者快速上手和对照复现。

来自主题: AI技术研报

8222 点击 2026-03-22 09:35

后训练中的RL已死？MIT新算法挑战传统后训练思维，谢赛宁转发

在当前的 LLM 开发中，后训练阶段通常被视为赋予模型特定能力的关键环节。传统的观点认为，模型必须通过强化学习（如 PPO、GRPO 或 RLHF）和进化策略（ES）等算法，在反复的迭代和梯度优化过程中调整权重，才能在特定任务上达到理想的性能。

来自主题: AI技术研报

6765 点击 2026-03-16 14:26

Legora、Mercor 都在用，Reducto 能成为独立的 LLM 数据入口吗？

Reducto 在去年 6 个月内接连完成分别由 Benchmark 与 a16z 领投的两轮融资，估值翻了 3 倍，达到 6 亿美元。我们认为，Reducto 切中了 AI 应用走向生产环境过程中的“精确数据摄取”瓶颈。

来自主题: AI资讯

10442 点击 2026-03-14 08:41

32B逆袭GPT-5.2：首个端到端GPU编程智能体框架StitchCUDA问世

现有的 LLM 自动化 CUDA 方法大多只能优化单个 Kernel，面对完整的端到端 GPU 程序（如整个 VisionTransformer 推理）往往束手无策。

来自主题: AI技术研报

9067 点击 2026-03-05 14:28

字节杀疯了！豆包 Seed 2.0 专家模式已上线

我天！感觉 Seed 1.8 发布还没多久，没想到 Doubao-Seed-2.0 这么快就杀到了…今天发都算是晚讯了。据官方介绍，这次 Seed 2.0 多模态理解能力全面升级，还强化了 LLM 与 Agent 能力，模型在真实长链路任务中可以稳定推进。

来自主题: AI资讯

11123 点击 2026-03-02 23:22

大语言模型真的会「推理」吗？一项系统性研究梳理 LLM 的结构性推理失败

近期发表于 TMLR 的论文《Large Language Model Reasoning Failures》对这一问题进行了系统性梳理。该研究并未围绕 “模型是否真正理解” 展开哲学层面的争论，而是采取更加务实的路径 —— 通过整理现有文献中的失败现象，构建统一框架，系统分析大语言模型的推理短板。

来自主题: AI技术研报

9419 点击 2026-02-26 10:52

一个模型统一所有离线任务！微软用671B大模型重构广告推荐「推理大脑」

近日，微软Bing Ads与DKI团队发表论文《AdNanny: One Reasoning LLM for All Offline Ads Recommendation Tasks》，宣布基于DeepSeek-R1 671B打造了统一的离线推理中枢AdNanny，用单一模型承载所有离线任务。这标志着从维护一系列任务特定模型，转向部署一个统一的、推理中心化的基础模型，从

来自主题: AI技术研报

9992 点击 2026-02-18 13:29